2. 开场需要探讨的几个问题

2.1. 生物相关工程的“就业窘境”

  1. 关于生物就业的现状,毋庸多言。这个深层次的原因是背后的产业。有一定数量的生物专业学生选择读研、读博,由于就业的眼里。做一个浅显的假设,如果在座的各位,本科毕业工作2-3年,月薪都可以在1w以上,估计今天课堂里的人会少了很多。

  2. 产业的原因,我们不细讲。单纯生物专业的培养模式,就存在很多问题。比如:课堂与实际严重脱钩;只重视知识的学习,而忽略技能的培养。大学四年的本科教育,变成了以“识记为主”的应试教育。整个大学四年,鲜有同学利用所学的知识,创造出了有价值的“产品”。

  3. 很多学校已经停招“生物技术”这门专业,已经说明了很多问题。

  4. 生物技术和计算机技术几乎是同时发展起来的两门学科。也是本科招生中,占比最大的两个专业。无论是专科院校还是本科院校,可以说“只要有学校的地方,就有生物和计算机”。但两者本科毕业生从业后的待遇差别很大。一个是:从18岁就开始的一门手艺活;一门是从18岁要不断识记、记了就忘的“知识传递行”专业。到了30岁,一般计算机专业的学生有了非常扎实的实战经验,而对于大多数生物学生而言,可能还没有接触到最核心、最前沿的技术。

2.2. 为什么要学习计算生物学

2.2.1. 生信和计算生物学是未来科研工作者必备的技能。

2.2.1.1. 生物系统是非常复杂、多变的系统,认知其规律,需要计算生物学

选择知乎上一位网友的答案: 作者:Yang Liu 链接:https://www.zhihu.com/question/268753897/answer/343477528 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  1. 合成生物学注重定量描述,定量数据收集需要计算机合成生物学与传统基因工程相比,最大的不同点在于定量基础上的通用平台构建。换言之,传统基因工程是以实现某种生物学功能为目的,对基因进行改造的工程学科。而合成生物学致力于找出基因行为以及对基因进行工程改造的各种基本规律,并在这些规律的基础上,有的放矢地、理性地(rational design)设计基因元件或基因线路并实现相应生物学功能。上述区别决定了合成生物学对定量描述的需要以及合成生物学与系统生物学、定量生物学的紧密关系。要想总结基因行为以及对基因进行工程改造的各种基本规律,首先就要对基因的行为及行为规律进行抽象,再归纳成模型。比如一个开启基因表达的启动子,它的开启强度有多强、其功能与RNA聚合酶浓度之间的关系如何、是否受到其它分子控制等等,都需要进行定量研究,并依据数据抽象成简化的模型,以便于运用这些规律去解决不同情境下的问题,帮助人们理解复杂系统下关键因素对基因行为的影响。要想得到可靠的规律,就需要高质量的定量数据。这些数据显然不是人类有办法通过机械手段直接获得的,荧光蛋白的浓度有多高,细胞的尺寸有多大,细胞与细胞之间的差异化程度,凭借肉眼看、掰手指数肯定无法获得精确的结果。因此计算机需要对各种仪器的信号进行处理,从而获得各种可靠的定量数据。

  2. 合成生物学注重模拟与预测,模型构建和运算需要计算机前面提到,合成生物学特别重视规律的总结和通用平台构建,并在此基础上追求理性设计。要总结规律,光靠计算机得到各类数据显然是不够的,还要对数据进行分析。生物系统是耗散结构,非线性动力学系统,基因的行为规律往往受到复杂因素影响,那么如何把繁复的数据中的规律提取出来,构建出合适的模型?显然肉眼看,靠珠算是不行的。计算机可以帮助人们分析数据并从中找出各种规律,搭建数学模型。计算机还可以通过计算人为设定参数下的数学模型去模拟尚未在实验室中实现的“假设状况”,从而为可预测地设计基因元件或线路提供参考依据,再到实验室中有方向地做实验对模型预测的结果进行验证,不断优化模型。如此反复,从而获得越来越高的理性设计能力。这些过程都依赖于计算机的运算功能。

  3. 合成生物学依赖高通量数据,高通量数据的处理需要计算机设计一定是基于可靠的规则。设计一座建筑,必须按照力学规律,否则就有可能无法成功搭建。基因及基因线路的设计也是一样的,没有可靠的规则,就没有理性设计可言。区别在于生物系统中基因的行为规律,远远比宏观力学规律复杂得多。当面对生物系统这种复杂系统时,我们还无法用非常简单的规律去描述。这也意味着还有大量的规律需要不断被发现和总结。从复杂系统中总结规律,往往需要海量数据。这些数据的存储、统计、使用都无法用传统方法搞定。唯有计算机能够胜任。当然,在科学研究中所有涉及海量数据的情形都需要计算机,这也不是合成生物学特有的需求。

  4. 合成生物学的自动化趋势,自动化平台的控制需要计算机现在人们常说生物学民工,说的就是上述海量数据的获取方法。海量数据如何获得是一个问题。对于没钱没设备的实验室而言,最廉价的方式就是通过人力投入获得海量数据。当然这种策略不可能永远不被革新,因此科学家也在尝试开发各种各样的自动化平台投入合成生物学研究。这类自动化平台可以在计算机的控制下,全自动或半自动地完成基因合成、细胞培养、筛选、保藏、定量检测等等工作。小到一片微流体芯片,大到整个分子生物学工作站,都依赖于特定的程序和算法运行。这些领域需要大量的计算机和计算机编程人才。

  5. 合成生物学与机器学习,机器学习需要计算机合成生物学既然重视理性设计,重视基因行为的可预测性,那么机器学习必然成为重要工具。机器学习运用于生物学并不是什么新闻,但是合成生物学领域对机器学习的需求不可小觑。机器学习的模式识别能力对于复杂系统的行为预测有着特殊的优势。随着高质量高通量数据的获得能力越来越强,机器学习程序有望在各式各样的数据中不断被训练,进而准确预测出传统数学模型尚无法预测的基因行为。

2.2.1.2. 日常实验,需要计算生物学做设计与分析

  1. 本质上,我们日常实验就是通过“量化实验”来探寻规律,创造产品。这个过程,需要建筑行业的AutoCAD、视觉行业的3D Max一样强大的辅助设计软件。

  2. 目前,生物领域辅助设计几乎没有工业级别的产品。大多以零散的、开源的形式存在。因此,我们必须掌握开源语法。真正工业级别的软件,可能10-20年以后才会出现。

2.2.2. 生物信息学与计算生物学是我们必备的技能,但不能是唯一的技能

在一个团队中,生信和计算生物学的作用,是信息的汇总与筛选中心,提高效率的关键位置。但需要时刻铭记的是,生信专家并不是最重要的环节。最重要的环节,一直,永远,未来也还是,产生数据的关键部分,比如负责实验的环节。

2.2.3. 职场发展必备的技能

  1. 如果打开招聘信息,要求python、matlab、R、Java的公司不在少数。一个人的价值,体现在其“不可替代性”。等我们走到了职场,会做试验的人大有人在,但会数据分析,尤其是自动化、智能化数据分析的,微乎其微。在这种情况下,高薪只能属于这一小撮人。

  2. 目前已经发展到系统生物学、合成生物学的时代。在这个时代,编程居于核心的地位。不会编程的人,很难胜任相关的工作。只能从事具体的实验。

../_images/0001.jpg